间接歧视是算法模型中主要关注的问题。在保险定价中尤其如此,不允许使用保护保单持有人特征进行保险定价。简单地忽略受保护的保单持有人的信息不是一个适当的解决方案,因为这仍然允许从非保护特征中推断出受保护特征的可能性。这导致所谓的代理或间接歧视。尽管代理歧视在质量上与机器学习中的集体公平概念不同,但提出了这些群体公平概念,以“平滑”受保护特征在计算保险价格中的影响。本说明的目的是根据保险定价分享有关团体公平概念的一些想法,并讨论其含义。我们提出了一个没有替代歧视的统计模型,因此从保险定价的角度来看,没有问题。但是,我们发现该统计模型中的规范价格无法满足三个最受欢迎的集体公正公理中的任何一个。这似乎令人困惑,我们欢迎对我们的示例和这些集体公正公理对非歧视性保险定价的有用性的反馈。
translated by 谷歌翻译
在预测建模的应用中,例如保险定价,间接或代理歧视是一个重大关注的问题。也就是说,存在一种受保护的保单持有人特征被预测模型隐含地推断出的受保护保单持有人特征的可能性,因此对价格产生了不良(或非法)的影响。解决此问题的技术解决方案依赖于使用所有保单持有人特征(包括受保护的人)建立最佳模型,然后平均为计算个人价格的受保护特征。但是,这种方法需要对保单持有人的受保护特征的充分了解,这本身可能是有问题的。在这里,我们通过使用多任务神经网络体系结构进行索赔预测来解决此问题,该预测只能使用有关受保护特征的部分信息进行培训,并且它产生的价格没有代理歧视。我们证明了所提出的模型的使用,我们发现其预测精度与常规的前馈神经网络相媲美(完整信息)。但是,在部分缺少保单持有人信息的情况下,这个多任务网络显然具有出色的性能。
translated by 谷歌翻译
Sepsis is a deadly condition affecting many patients in the hospital. Recent studies have shown that patients diagnosed with sepsis have significant mortality and morbidity, resulting from the body's dysfunctional host response to infection. Clinicians often rely on the use of Sequential Organ Failure Assessment (SOFA), Systemic Inflammatory Response Syndrome (SIRS), and the Modified Early Warning Score (MEWS) to identify early signs of clinical deterioration requiring further work-up and treatment. However, many of these tools are manually computed and were not designed for automated computation. There have been different methods used for developing sepsis onset models, but many of these models must be trained on a sufficient number of patient observations in order to form accurate sepsis predictions. Additionally, the accurate annotation of patients with sepsis is a major ongoing challenge. In this paper, we propose the use of Active Learning Recurrent Neural Networks (ALRts) for short temporal horizons to improve the prediction of irregularly sampled temporal events such as sepsis. We show that an active learning RNN model trained on limited data can form robust sepsis predictions comparable to models using the entire training dataset.
translated by 谷歌翻译
This work proposes Multi-task Meta Learning (MTML), integrating two learning paradigms Multi-Task Learning (MTL) and meta learning, to bring together the best of both worlds. In particular, it focuses simultaneous learning of multiple tasks, an element of MTL and promptly adapting to new tasks with fewer data, a quality of meta learning. It is important to highlight that we focus on heterogeneous tasks, which are of distinct kind, in contrast to typically considered homogeneous tasks (e.g., if all tasks are classification or if all tasks are regression tasks). The fundamental idea is to train a multi-task model, such that when an unseen task is introduced, it can learn in fewer steps whilst offering a performance at least as good as conventional single task learning on the new task or inclusion within the MTL. By conducting various experiments, we demonstrate this paradigm on two datasets and four tasks: NYU-v2 and the taskonomy dataset for which we perform semantic segmentation, depth estimation, surface normal estimation, and edge detection. MTML achieves state-of-the-art results for most of the tasks. Although semantic segmentation suffers quantitatively, our MTML method learns to identify segmentation classes absent in the pseudo labelled ground truth of the taskonomy dataset.
translated by 谷歌翻译
经验丰富的用户通常在解决现实世界优化问题方面具有有用的知识和直觉。用户知识可以作为可变关系的配方,以帮助优化算法更快地找到良好的解决方案。此类间相互作用也可以自动从优化运行中的中间迭代中发现的高性能解决方案中自动学习 - 一种称为Innovization的过程。如果用户对这些关系进行审查,则可以在新生成的解决方案中执行,以将优化算法引导到搜索空间中实际上有希望的区域。对于大规模问题,这种可变关系的数量可能很高,就会出现挑战。本文提出了一个基于交互式知识的进化多目标优化(IK-EMO)框架,该框架将隐藏的可变关系提取为从不断发展的高性能解决方案中的知识,与用户共享它们以接收反馈,并将其应用于优化提高其有效性的过程。知识提取过程使用系统而优雅的图形分析方法,该方法与变量数量很好地缩放。在三个大规模的现实世界工程设计问题上证明了拟议的IK-EMO的工作。提出的知识提取过程和高性能解决方案的实现的简单性和优雅迅速表明了所提出的框架的力量。提出的结果应激发进一步的基于相互作用的优化研究,以实践其常规使用。
translated by 谷歌翻译
ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列,该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战,这是由于探测器的几何形状,不均匀的散射和冰中光的吸收,并且低于100 GEV的光,每个事件产生的信号光子数量相对较少。为了应对这一挑战,可以将ICECUBE事件表示为点云图形,并将图形神经网络(GNN)作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开,对不同的中微子事件类型进行分类,并重建沉积的能量,方向和相互作用顶点。基于仿真,我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术,包括已知系统不确定性的影响。对于中微子事件分类,与当前的IceCube方法相比,GNN以固定的假阳性速率(FPR)提高了信号效率的18%。另外,GNN在固定信号效率下将FPR的降低超过8(低于半百分比)。对于能源,方向和相互作用顶点的重建,与当前最大似然技术相比,分辨率平均提高了13%-20%。当在GPU上运行时,GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件,这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。
translated by 谷歌翻译
在恶性原发性脑肿瘤中,癌细胞浸润到周围的脑结构中,导致不可避免的复发。对周围区域的浸润性异质性(活检或切除可能是危险的区域)的定量评估对于临床决策很重要。以前关于表征周围区域浸润性异质性的工作使用了各种成像方式,但是已经探索了细胞外无水运动限制的信息。在这里,我们通过使用基于扩散的张量成像(DTI)的自由水量分数图来表征一组独特的人工智能(AI)标记,从而捕获肿瘤浸润的异质性,从而捕获肿瘤的异质性。首先通过利用胶质母细胞瘤和脑转移的广泛不同的水扩散性能作为在周围肿瘤组织中有和没有浸润的区域的区域,首先提取了一种新型的基于体素的深度学习周围微环境指数(PMI)。均匀高PMI值的局部枢纽的描述性特征被提取为基于AI的标记,以捕获渗透性异质性的不同方面。提出的标记物应用于两个临床用例,对275个成人型弥漫性神经胶质瘤的独立人群(4级)分析,分析异氯酸盐 - 脱水酶1(IDH1) - wildtypes之间的生存持续时间以及带有IDH1-杀剂的差异。我们的发现提供了一系列标记物作为浸润的替代物,可捕获有关周围微观结构异质性生物学潜在生物学的独特见解,使其成为与生存和分子分层有关的预后生物标志物,并具有潜在的适用性在临床决策中。
translated by 谷歌翻译
成像检查(例如胸部X射线照相)将产生一小部分常见发现和一组少数罕见的发现。虽然训练有素的放射科医生可以通过研究一些代表性的例子来学习罕见条件的视觉呈现,但是教机器从这种“长尾”分布中学习的情况更加困难,因为标准方法很容易偏向最常见的类别。在本文中,我们介绍了胸部X射线胸腔疾病特定领域的长尾学习问题的全面基准研究。我们专注于从自然分布的胸部X射线数据中学习,不仅优化了分类精度,不仅是常见的“头”类,而且还优化了罕见但至关重要的“尾巴”类。为此,我们引入了一个具有挑战性的新长尾X射线基准,以促进开发长尾学习方法进行医学图像分类。该基准由两个用于19-和20向胸部疾病分类的胸部X射线数据集组成,其中包含多达53,000的类别,只有7个标记的训练图像。我们在这种新的基准上评估了标准和最先进的长尾学习方法,分析这些方法的哪些方面对长尾医学图像分类最有益,并总结了对未来算法设计的见解。数据集,训练有素的模型和代码可在https://github.com/vita-group/longtailcxr上找到。
translated by 谷歌翻译
机器学习的回归分支纯粹集中于连续值的预测。监督学习分支具有许多基于回归的方法,具有参数和非参数学习模型。在本文中,我们旨在针对与基于距离的回归模型相关的非常微妙的点。所使用的基于距离的模型是K-Nearest邻居回归器,它是一种监督的非参数方法。我们要证明的观点是模型的k参数的效果及其影响指标的波动。我们使用的指标是根平方误差和R平方拟合的优点,其值相对于K值的值表示。
translated by 谷歌翻译
减少的牵引力限制了移动机器人系统抵抗或施加大型外部负载的能力,例如拉紧有效载荷。一种简单且通用的解决方案是将束缚在天然发生的物体周围,以利用卡普斯坦效应并呈指数放大的固定力。实验表明,理想化的Capstan模型解释了对常见不规则室外物体(树木,岩石,柱子)经历的力放大。适用于可变环境条件,这种指数放大方法可以串联或与机器人团队并行利用单个或多个capstan对象。这种适应性允许一系列潜在配置,对于当对象无法完全包围或抓住时,特别有用。这些原则已通过移动平台证明(1)控制有效载荷的降低和逮捕,(2)以实现有效载荷的平面控制,以及(3)充当更大范围平台的锚点。我们显示了一个简单的系绳,包裹在沙子上的浅石头上,放大了低牵引力平台的持有力量,最多可达774倍。
translated by 谷歌翻译